พื้นฐานปัญญาประดิษฐ์เชิงสร้างสรรค์ในภาษาไพธอน: การเปลี่ยนแปลงแนวคิด: จากการปรับแต่งแบบละเอียดไปสู่การวิเคราะห์ตามคำแนะนำ

จินตนาการถึงความยากลำบากในการขึ้นรูปสมอง หรือเพียงแค่ส่งบทสนทนาให้มัน ในการยุคก่อนหน้านี้ของภาษาธรรมชาติ (NLP) การปรับโดเมน เป็นกระบวนการที่เหน็ดเหนื่อยของการ การเรียนรู้แบบถ่ายทอด หรือ PEFT (การปรับแต่งแบบมีประสิทธิภาพต่อพารามิเตอร์). เราได้ใช้โมเดลเหมือนดินเหนียว จำเป็นต้องใช้ตัวอย่างที่ระบุชื่อหลายพันตัว เพื่อแก้ไขค่าภายในอย่างเป็นรูปธรรม — ซึ่งเป็นกระบวนการที่ใช้พลังงานคอมพิวเตอร์มาก และทำให้เกิดโมเดลที่คงที่และเฉพาะเจาะจงสูง เช่น BERT

ตัวเร่งปฏิกิริยาของ GPT-3

การเปิดตัว GPT-3 เป็นจุดสำคัญของ ระดับสูงสุด (SOTA) จุดหมายสำคัญ มันพิสูจน์ว่า การเรียนรู้จากบริบท—โดยที่โมเดลสามารถระบุรูปแบบโดยตรงจากคำแนะนำ—มักจะเท่ากับหรือดีกว่าการปรับแต่งเฉพาะสำหรับงานทั่วไป เราได้ก้าวไปสู่ การวิเคราะห์ตามคำแนะนำโดยที่ความล่าช้าและความเสียหายจากการอัปเดตเกรเดียนต์ถูกแทนที่ด้วยการใส่บริบทอย่างมีกลยุทธ์

ตัวอย่างในโลกจริง

การสร้างเครื่องวิเคราะห์ด้านกฎหมายเคยต้องใช้เวลานานหลายสัปดาห์ในการปรับแต่ง BERT บนคดีศาล แต่ในปัจจุบัน นักพัฒนาใช้คำแนะนำพร้อมตัวอย่างสัญญาสามฉบับ ทำให้ได้ความแม่นยำใกล้เคียงกันภายในไม่กี่นาที โดยใช้โมเดลขนาดใหญ่ที่ไม่เปลี่ยนแปลง

กรณีศึกษา: ผู้ขับรถแท็กซี่อัตโนมัติ

อ่านสถานการณ์ด้านล่างและตอบคำถาม

พิจารณาการสร้างเอเจนต์ผู้ขับรถแท็กซี่อัตโนมัติ หน้าที่ของมันคือการเดินทางอย่างปลอดภัยในถนนเมือง ปฏิบัติตามกฎจราจร และเพิ่มความสะดวกสบายของผู้โดยสาร ขณะที่ลดเวลาการเดินทาง $\tau$

คำถาม

1. สิ่งใดจะประกอบเป็นพื้นที่ "สภาพแวดล้อม" $E$ สำหรับเอเจนต์นี้?

คำตอบ:
ถนนจริง ยานพาหนะอื่น ๆ $v_i \in V$ คนเดิน ไฟจราจร และสภาพอากาศ

คำถาม

2. ให้ตัวอย่างเซนเซอร์ $S$ และแอคตูเอเตอร์ $A$ สำหรับเอเจนต์แท็กซี่นี้

คำตอบ:
เซนเซอร์: กล้องถ่ายภาพ ไลดาร์ ระบบกำหนดตำแหน่ง (GPS) $(x, y)$ เครื่องวัดความเร็ว $ds/dt$ เซนเซอร์เครื่องยนต์
แอคตูเอเตอร์: พวงมาลัย $\theta$ เบรก คันเร่ง ไซเรน ไฟเลี้ยว

คำถาม

3. วิธีการวัดค่าประสิทธิภาพ $U(s)$ ของมันอาจเป็นอย่างไร?

คำตอบ:
อาจเป็นผลรวมที่มีน้ำหนัก คำนวณว่า:
$$U(s) = w_1 \cdot \text{ระยะทาง}(\Delta x) - w_2 \cdot \text{เวลา}(\Delta t) - w_3 \cdot \text{การชน} + w_4 \cdot \text{กำไร}$$